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Ribof lavin-Biosynthese in Pilzen 
* Beschreibung " * 

5 

Die vorliegende Erfindung betrifft die Gene fur Ribof lavin-Bio- 
synthese in Pilzen, die damit codierten Proteine sowie gen- 
technische Verfahren zur Hersteilung von Riboflavin unter Ver- 
wendung dieser Gene und Genprodukte. 

10 

Die Hersteilung von Riboflavin durch Fermentation von Pilzen wie 
Eremothecium ashbyii oder Ashbya gossypii ist bekannt (The Merck 
Index, Windholz et al., eds. Merck & Co., Seite 1183, 1983). 

15 In der EP 405370 sind Ribof lavin-iiberproduzierende Bakterien- 
stamme beschrieben, die durch Transformation der Ribof lavin-Bio- 
synthese-Gene aus Bacillus subtilis erhalten wurden. 

Da die Genetik der Ribof lavin-Biosynthese in Bakterien und 
20 Eukaryonten verschieden ist, sind die oben erwahnten Gene aus 
Bacillus subtilis nicht fur ein rekombinantes Herstellverf ahren 
fur Riboflavin mit eukaryontischen Produktionsorganismen wie 
Ashbya gossypii geeignet. 

25 In einer am 19.11.1992 beim Deutschen Patentamt eingereichten 
Patentanmeldung wurde die Klonierung der Ribof lavin-Biosynthese 
Gene der Hefe Saccharomyces cerevisiae beschrieben. 

Eine Klonierung der Ashbya gossypii Ribof lavin-Biosynthese Gene 
30 unter Verwendung der S. cerevisiae RIB-Gene rait iiblichen Hybridi- 
sierungsmethoden gelang jedoch nicht; offenbar war die Homologie 
der RIB-Gene aus 5. cerevisiae und A. gossypii fiir eine Hybridi- 
sierung nicht gro£ genug. 

35 Es bestand daher die Aufgabe, die Ribof lavin-Biosynthese Gene aus 
einem Eukaryonten zu isolieren, um damit ein rekombinantes Her- 
stellverfahren fiir Riboflavin in einem eukaryontischen Produkti- 
onsorganismus bereitzustellen. 

40 DemgemaB wurden in dem Ascomyceten Ashbya gossypii sechs Gene 
(rib-Gene) , die fiir Enzyme der Ribof lavin-Biosynthese ausgehend 
von GTP codieren, gefunden und isoliert. 

Die Erfindung betrifft die folgenden DNA-Sequenzen: 

45 
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DNA-Seqiienzen, die fur ein Polypeptid mit der in SEQ ID NO: 2 
dargestellten Aminosauresequenz codieren oder fiir ein Anaioges 
qder Derivat des Polypeptids gemafi SEQ ID NO: 2, worin.eine oder . 
■•mehrere Aminosauren deietiert-, hinzugefiigt oder durch anciere Ami- 
5 nosauren substituiert worden sind, ohne die enzymatische Wirkung 
des Polypeptids wesentlich zu reduzieren. 

DNA-Sequenzen,. die fiir ein Polypeptid mit der in SEQ ID NO: 4 
dargestellten Aminosauresequenz codieren oder fiir ein Anaioges 
10 oder Derivat des Polypeptids gemafi SEQ ID NO: 4, worin eine oder 
mehrere Aminosauren deietiert, hinzugefiigt oder durch andere Ami- 
nosauren substituiert worden sind, ohne die enzymatische Wirkung 
des Polypeptids wesentlich zu reduzieren. 

15 DNA-Sequenzen, die fiir ein Polypeptid mit der in SEQ ID NO: 6 
dargestellten Aminosauresequenz codieren oder fiir ein Anaioges 
oder Derivat des Polypeptids gemafi SEQ ID NO: 6, worin eine oder 
mehrere Aminosauren deietiert, hinzugefiigt oder durch andere Ami- 
nosauren substituiert worden sind, ohne die enzymatische Wirkung. 

20 des Polypeptids wesentlich zu reduzieren. 

DNA-Sequenzen, die fiir ein Polypeptid mit der in SEQ ID NO: 8 
dargestellten Aminosauresequenz codieren oder fiir ein Anaioges 
oder Derivat des Polypeptids geraafi SEQ ID NO: 8, worin eine oder 
25 mehrere Aminosauren deietiert, hinzugefiigt oder durch andere Ami- 
nosauren substituiert worden sind, ohne die enzymatische Wirkung 
des Polypeptids wesentlich zu reduzieren. 

DNA-Sequenzen, die fiir ein Polypeptid mit der in SEQ ID NO: 10 
30 dargestellten Aminosauresequenz codieren oder fiir ein Anaioges 
oder Derivat des Polypeptids gemali SEQ ID NO: 10 , worin eine oder 
mehrere Aminosauren deietiert, hinzugefiigt oder durch andere Ami- 
nosauren substituiert worden sind, ohne die enzymatische Wirkung 
des Polypeptids wesentlich zu reduzieren. 

35 

DNA-Sequenzen, die fiir ein Polypeptid mit der in SEQ ID NO: 12 
dargestellten Aminosauresequenz codieren oder fiir ein Anaioges 
oder Derivat des Polypeptids gemaB SEQ ID NO: 12, worin eine oder 
mehrere Aminosauren deietiert, hinzugefiigt oder durch andere Ami- 
40 nosauren substituiert worden sind, ohne die enzymatische Wirkung 
des Polypeptids wesentlich zu reduzieren. 

Die Gene und ihre Genprodukte (Polypeptide) sind im Sequenz- 
protokoll mit ihrer Primarstruktur aufgefiihrt und haben folgende 
45 Zuordnung: 



SEQ ID NO: 1 : rib 1-Gen 
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Guanosintriphosphat (GTP) wird durch GTP-Cyclohydrolase II (rib 
1-Genprodukt) zu 2, 5-Diamino-6-ribosylamino-4- (3H) -pyrimidinon- 

15 5-phosphat umgewandelt * Diese Verbindung wird anschlieflend durch 
rib 7-Genprodukt zu 2, 5-Diamino-ribitylamino-2, 4 (1H, 3H)- 
pyrimidin-5-phosphat reduziert und dann durch rib 2-Genprodukt 
zum 5-Amino-6-ribitylamino-2, 4 (1H, 3H)-pyrimidindion dearainiert . 
AnschlieBend wird in einer rib 4-Genprodukt katalysierten Reak- 

20 tion die C4-Verbindung DBP hinzugefiigt und es entsteht 

6, 7-Dimethyl-8-ribityllumazin (DMRL) , aus dem in der rib 5-Gen- 
produkt katalysierten Reaktion Riboflavin entsteht. Die C4-Ver- 
• bindung DBP (L-3, 4-Dihydroxy-2-butanon-4-phosphat) wird aus 
D-Ribulose-5-phosphat in einer rib 3-Genprodukt katalysierten 

25 Reaktion gebildet . 

Die in SEQ ID NO: 1,3,5,7,9,11 beschriebenen DNA-Sequenzen codie- 
ren fur die Polypeptide, die in SEQ ID NO: 2,4,6,8,10,12 be- 
schrieben sind, 

30 

AuJJer den im Sequenzprotokoll genannten DNA-Sequenzen sind auch 
solche geeignet, die infolge der Degeneration des genetischen 
Codes eine andere DNA Sequenz besitzen, jedoch fur das gleiche 
Polypeptid codieren. 

35 

Weiterhin sind auch solche DNA Sequenzen Gegenstand der Erfin- 
dung, die fur ein Genprodukt (Polypeptid) mit anderer als der im 
Sequenzprotokoll aufgefuhrten Primarstruktur codieren, solange 
das Genprodukt noch im wesentiichen die gleichen biologischen Ei- 
40 genschaften wie das im Sequenzprotokoll genannte Genprodukt be- 
sitzt. Unter biologischen Eigenschaften sind vor allem die die 
Biosynthese von Riboflavin bewirkenden enzymatischen Aktivitaten 
zu verstehen. 

45 Solche veranderten Genprodukte mit im wesentiichen gleichen bio- 
logischen Eigenschaften sind durch Deletion oder Hinzufiigen von 
einer oder mehreren Aminosauren oder Peptiden oder durch Aus- 
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tausch von Aminosauren durch anciere Aminosauren erhaltlich oder 
konnen aus anderen Organismen als Ashbya gossypii isoliert wer- 
den. 

5 Die DNA-Sequenzen, die fur die veranderten Genprodukte codieren, 
sind zu den DNA-Sequenzen gemafl Sequenzprotokoll in der Regel zu 
80 oder mehr Prozent homolog. Solche DNA-Sequenzen lassen sich 
ausgehend von den in SEQ ID NO: 1, 3, 5, 7, 9, 11 beschriebenen 
DNA-Sequenzen, beispielsweise mit iiblichen Hybridisierverf ahren 
10 oder der PCR-Technik aus anderen Eukaryonten als Ashbya gossypii 
isolieren. Diese DNA-Sequenzen hybridisieren unter Standard- 
bedingungen mit den in SEQ ID NO: 1, 3, 5, 7, 9, 11 beschriebenen 
DNA-Sequenzen. 

15 Unter Standardbedingungen sind beispielsweise Temperaturen 
zwischen 42 und 58°C in einer waUrigen Pufferlosung mit einer 
Konzentration zwischen 0,1 und 1 x SSC (1 x SSC: 0,15M NaCI, 15mM 
Natriumcitrat pH 7,2) zu verstehen. Die experimentellen Bedingun- 
gen fur DNA-Hybridisierungen sind in Lehrbuchern der Gentechnik, 

20 beispielsweise in Sambrook et al. f "Molecular Cloning", Cold 
Spring Harbor Laboratory, 1989, beschrieben. 

Ein weiterer Gegenstand der Erfindung sind Regulationssequenzen, 
insbesondere Promoter sequenz en, die in 5'-Richtung vor den fur 
25 die entsprechenden Polypeptid codierenden DNA-Sequenzen liegen. 
Die Regulationssequenzen sind im Sequenzprotokoll aufgefiihrt und 
im f olgenden naher erlautert . 



Regulationssequenz fur rib 1-Gen: 
30 SEQ ID NO: 1 Nukleotid 1-242 

Regulationssequenz fur rib 2-Gen: 
SEQ ID NO: 3 Nukleotid 1-450 

35 Regulationssequenz fur rib 3-Gen: 
SEQ ID NO: 5 Nukleotid 1-314 

Regulationssequenz fur rib 4-Gen: 
SEQ ID NO: 7 Nukleotid 1-270 

40 

Regulationssequenz fur rib 5-Gen: 
SEQ ID NO: 9 Nukleotid 1-524 



Regulationssequenz fur rib 7-Gen: 
45 SEQ ID NO: 11 Nukleotid 1-352 
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Die Regulationssequenzen konnen auch noch in 5'- und/oder 
3'-Richtung verkurzt werden, ohne dafi ihre Funktion wesentlich 
nachlafit . 

5 Essentieli fur die Regulationswirkung sind in der Regel Fragmente 
von 30 bis 100, bevorzugt 40 bis 70 Nukleotiden aus den oben an- 
gegebenen Sequenzbereichen. 

Diese Regulationssequenzen konnen auch durch gerichtete 
10 Mutagenese im Vergieich zu den natiirlichen Sequenzen in ihrer 
Funktion optimiert werden. 

Die erf indungsgemaJien Regulationssequenzen eignen sich fur die 
Uberexpression von Genen in Ashbya, insbesondere von Genen, die 
15- fur die Ribof lavin-Biosynthese verantwortlich sind. 

Weiterhin sind Gegenstand der Erfindung Expressionsvektoren, die 
eine oder mehrere der erf indungsgemafien DNA-Sequenzen enthalten. 
Solche Expressionsvektoren erhalt man, indem man die erfindungs- 
20 gemafien DNA-Sequenzen mit geeigneten f unktionellen Regulations- 
signalen versieht. Solche Regulationssignale sind DNA-Sequenzen, , 
die fur die Expression verantwortlich sind, beispielsweise 
Promotoren, Operatoren, Enhancer, ribosomale Bindungsstellen, und 
die vom Wirtsorganismus erkannt und bedient werden. 

25 

Gegebenenf alls konnen noch weitere Regulationssignale, die bei- 
spielsweise Replikation oder Rekombination der rekombinanten DNA 
ira Wirtsorganismus steuern, Bestandteil des Expressionsvektors 
sein. 

30 

Ebenso gehdren die mit den erfindungsgem&Ben DNA-Sequenzen oder 
Expressionsvektoren transf ormierten Wirtsorganismen zum Gegen- 
stand der Erfindung. Bevorzugt werden als Wirtsorganismen 
eukaryontische Organismen, besonders bevorzugt solche der Gattung 
35 Saccharomyces, Candida, Pichia, Eremothecium oder Ashbya 
verwendet. Besonders bevorzugte Arten sind Saccharomyces 
cerevisiae, Candida flaveri, Candida famata, Eremothecium ashbyii 
und Ashbya gossypii. 

40 Weiterhin gehort zur Erfindung ein rekombinantes Herstell- 
verfahren fur Riboflavin, in dem die erf indungsgemaiien trans- 
formierten Wirtsorganismen in an sich bekannter Weise durch 
Fermentation geziichtet werden und das wahrend der Fermentation 
gebildete Riboflavin aus dem Ferment at ionsmedium isoliert und 

45 gegebenenf alls gereinigt wird. 
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Die rib-Gene und -Genprodukte iassen sich wie im Beispiel und im 
Sequenzprotokoll beschrieben isolieren und charakterisieren. 



* ' Beispiel 1 

5 Isolierung der Ashbya gossypii Riboflavin Biosynthese Gene (rib- 
Gene) 



a, Konstruktion einer Ashbya gossypii cDNA-Bank 



10 Gesamt RNA wuzde aus dem Mycel des Riboflavin uberproduzierenden 
Stammes Ashbya gossypii ATCC 10195 nach Ziichtung auf YEPD Medium 
(Sherman et al., "Methods in yeast genetics", Cold Spring Harbor , 
Kew York, 1989) in der spaten logarithmischen Wachstumsphase ex- 
trahiert . 

15 

Poly (A) * RNA wurde durch zweimalige Adsorption und Elution an 
oligo(dT) -Cellulose gereinigt (Aviv und Leder, Proc. Natl. Acad. 
Sci. USA 69 f 1972 f 1408-1412). Die cDNA wurde nach der allgemeinen 
Vorschrift von Gubler und Hoffmann isoliert ( Gene 25, 1983, 263) 

20 und synthetische EcoRI -Adaptoren wurden an die Enden der blunt- 
end cDNA-Molekiile hinzugefiigt. Die EcoRI nachgeschnittenen cDNA 
Fragmente wurden anschlieflend mittels T4 Polynukleotidkinase 
-phosphoryliert und in den dephosphorylierten EcoRI geschnittenen 
Vektor pYEura3 kloniert (Fig. 1). pYEura3 (Clonetech 

25 Laboratories, Inc., Kalifornien) ist ein Hefe-Expressionsvektor, 
der die Galaktose-induzierbaren GAL1 und GAL10 Promotoren und 
URA, CEN4 und ARS1 beinhaltet. Diese Hefeelemente erlauben die 
Transformation und Expression klonierter DNA-Fragmente in Hefe- 
zellen. 

30 

Aliquots der Ligationsreaktion wurden benutzt um hochkompetente 
(Hanahan, DNA Cloning, ed. D.M. Glover; IRL Press, Oxford 1985, 
109) E. coli XLl-Blue (Bullock et al. f Biotechniques 5 (1987) 
376-378) zu transf ormieren und Transf ormanden wurden auf Basis 
35 ihrer Ampicillinresistenz selektioniert . 

Etwa 3 x 10 5 ampicillinresistente Zellen wurden vereinigt, 
amplif iziert und daraus Plasmid-DNA isoliert (Birnboim und Doly, 
Nucleic Acids Res. 7, 1979, 1513). 

40 

b. Isolierung von Ashbya gossypii cDNA-Klonen, die fur ribofla- 
vinbildende Enzyme codieren 



45 
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cDNA-Klbne von Ashbya gossypii, die fur ribof lavinbildende Enzyme 
codxeren, wurden durch funktionelle Kompiementation von Saccharo- 
myces cerevisiae Mutanten, die in der Ribof lavin-Biosynthese be- 
troffen s.ind, isoliert. 

5 

Die Stamme AJ88 ( Mata leu2 his3 ribl::0RA3 ura3-52) , AJ115 (Ma- 
talpha leu2 inosl rib2::URA3 ura3-52), AJ71 (Matalpha leu2 inosl 
rib3::URA3 ura3-52), AJ106 (Matalpha leu2 inosl rib4::URA3 
ura3-52), AJ66 (Mata canR inosl rib5::URA3 ura3-52) und AJ121 
10 (Matalpha leu2 inosl rib7::URA3 ura3-52) sind mutierte Stamme 
die durch Zerstorung eines der sechs Gene (RIB1 bis RIB5 und ' 
RIB7), die in die Ribof lavinbiosynthese bei Saccharomyces 
cerevisiae involviert sind. 

15 Diese Stamme wurden jeweils mit 25 |*g cDNA aus der Ashbya gossypii 
cDNA-Bank transf ormiert und auf festem Galaktose-haltigem Medium 
ohne Riboflavin ausplattiert . Nach ungefahr einer Woche Wachstum 
wurden Rib+ Transf ormanden von den Kulturschalen isoliert. 

20 Jeweils eine Transformande von jeder transformierten Mutante 
(Ribl + , Rib2 +f Rib3+, Rib4+, RibSf und Rib7 + ) wurde analysiert 
und in alien Fallen wurde gefunden, dafl der Rib+ Phanotyp nur in 
Galaktosemedium, nicht jedoch in Glucosemedium exprimiert war. 

25 Diese Ergebriisse belegen, dafl der Rib+ Phanotyp unter der Kon- 
trolle des plasmidstandigen galaktoseinduzierbaren GAL10 Promo- 
tors exprimiert wurde. 

,« "ff mid - DNA wurde aus den R ibl + ^ Rib2 + , Ri b3+ , Rib4 + , Ri b5+ und 
30 Rib7+ Transf ormanden durch Transformation von E. coli isoliert 
und pJR715, pJR669, P JR788, pJR733, pJR681 und pJR827 genannt. 

Partialsequenzierung der in diesen Plasmiden enthaltenen cDNA-In— 
sertionen bestatigte, dafl sie fur Proteine codieren, die analog 
35 zu Proteinen der Rib-Genprodukte aus Saccharomyces sind. 

c Isolierung von Ashbya gossypii genomischen Klonen, die fiir ri- 
boflavinbildende Enzyme codieren 

40 Dm die genomischen Kopien der riboflavinbildenden Gene von Ashbya 
gossypii zu isolieren wurde eine genomische Bank von Ashbya gos- 
sypii ATCC 10195 in dem Cosmid superCosl (Stratagene Cloning Sy- 
stems, Kalifornien) angelegt und mit 32p-markierten Proben, die 
von den cDNA Kopien der RIB1, RIB2, RIB3, RIB4, RIB5 und RIB7 

45 Gene von Ashbya gossypii abgeleitet waren, gescreent. 



WO 95/26406 PCT/EP95/00958 

8 

Cosmid Klone mit RIB1, RIB2, RIB3, RIB4, RIBS und RIB7 DNA wurden 
isoliert durch Koloniehybridisierung (Grunstein und Hogness, 
Proc; Natl. Acad. Sci. USA 72, 1975, 3961-3965). Weitere Southern 
Analysen von enzymatisch gespaltener Cosmid .DNA unter Verwendung-. 
5 der gleichen RIB-spezif ischen cDNA Proben erlaubte die Identifi- 
zierung definierter Restriktionsf ragmente, die die RIB1, RIB2, 
RIB3, RIB4, RIB5 und RIB7 Gene von Ashbya gossypii enthielten. 

Ein 3,1 kb langes BamHI-Clal DNA Fragment wurde gefunden, das das 
10 gesamte RIB1 Gen von Ashbya gossypii, codierend fur GTP-Cyclohy- 
drolase II enthielt. Dieses Fragment wurde aus einem Agarose Gel 
isoliert und in den BamHI und Clal geschnittenen pBluescript KS 
{+) phagemid (Stratagene Cloning Systems) kloniert und lieferte 
so das Plasmid pJR765 {Fig. 2) . 

15 

Eine 1329 bp lange DNA Sequenz wurde erhalten (SEQ ID N0:l) f die 
den RIB1 offenen Leserahmen von 906 bp, 242 bp von der 5'-nicht- 
kodierenden Region und 181 bp von der 3' -nichtkodierenden Region 
enthielt . 

20 

Das gesamte Ashbya gossypii RIB2 Gen, das fur die DRAP-Deaminase 
codiert, wurde auf einem 3,0 kb langen EcoRI-PstI Fragment, gefun- 
den, das kloniert in pBluescript KS C+) das Plasmid PJR758 ergab 
(Fig. 3) . 

25 

Eine 2627 bp lange Region der EcoRI-Pstl-Insertion mit dem offe- 
nen Leserahmen von RIB2 von 1830 bp, 450 bp der 5' -untranslatier- 
ten Region und 347 bp der 3' -untranslatierten Region wurde se- 
quenziert (SEQ ID NO:3). 

30 

Das gesamte Ashbya gossypii RIB3 Gen, das fiir die DBP-Synthase 
codiert, wurde auf einem 1,5 kb langen Pstl-Hindlll Fragment ge- 
funden, das kloniert in pBluescript KS {+) das Plasmid PJR790 er- 
gab (Fig. 4) . 

35 

Eine 1082 bp lange Region der Pstl-Hindlll-Insertion mit dem of- 
fenen Leserahmen von RIB3 von 639 bp, 314 bp der 5' -untransla- 
tierten Region und 129 bp der 3 '-untranslatierten Region wurde 
sequenziert (SEQ ID NO: 5). 

40 

Das Ashbya gossypii RIB4 Gen, das fiir die DMRL-Synthase codiert, 
wurde auf einem 3,2 kb langen Pstl-PstI Fragment gefunden, das 
kloniert in pBluescript KS (-) das Plasmid PJR762 ergab (Fig. 5). 



45 
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Eine 99€ bp lange Region der Pstl-Pstl-insertion mit dem offenen 
Leserahmen von RIB4 von 519 bp, 270 bp der 5< -untranslatierteT 
Reg 10 n und 207 bp der 3' -untranslatierten Region wurde sequel 
ziert (SEQ ID. NO: 7) . 46 

Das gesamte Ashbya gossypii RIB5 Gen, das fur die Ribof lavin-Syn- 
thase codiert, wurde auf einem 2,5 kb langen Patl-PstI Fragment 
gefunden, das kloniert in pBluescript KS ( + ) das Plasmid PJR739 
(Fxg. 6) ergab. 

10 

Eine 1511 bp lange Region der Pstl-Pstl-insertion mit dem offenen 
Leserahmen von RIBS von 708 bp, 524 bp der 5' -untranslatierten 
Regxon und 279 bp der 3<-untranslatierten Region wurde seamen 
ziert {SEQ ID NO:9). sequen 

15 

SchlieJilich wurde das Ashbya gossypii RIB7 Gen, das fur die HTP- 
Reduktase codiert, auf einem 4,1 kb langen EcoRI-EcoRl-Fragment 
e~ n ig d 7;. kl ° niert ±n PB1U6SCript KS < + > - P~ 

20 

Eine 1596 bp lange Region der EcoRI-EcoRI-.insertion mit dem offe- 
nen Leserahmen von RIB7 von 741 bp, 352 bp der 5'-untransTat"r- 
ten Region und 503 bp der 3' -untranslatierten Region wu^e- 
quenziert (SEQ ID NO: 11) 

25 

Beispiel 2 

mRNA Analyse der Ashbya gossypii RIB-Gene 

30 Urn die RIB spezifischen Transkripte zu identifizieren wurden 
Northern Analysen durchgef iihrt . Gesamt RNA wurde aus dem Ashbva 
gossypii Stamm ATCC 10195 wie in Beispiel 1 bescnriebeT i o- 
ixjrt Die RNA Proben des Stammes (5 ug) wurden elektrophoretisch 

35 GraL 6 ^ h' 8% A9 " 0Se - F0r - ^hyd-Gelen zusammen mit RNA- 

35 Grofienmarkern und unter Vakuum auf Nylonmembrane geblottet (Tho- 
mas, Proc. Natl. Acad. Sci. OS A, 77, 1980, 5201-5205) 

Die Nylonmembranen wurden unabhangig voneinander mit 32 P _ markier _ 
ten RIB-spezifischen DNA-Proben bei 42»c in SxSSC u „h < n marKier 
40 von so 4 r*™*^* w u -j. • in 3Xi>sc und in Gegenwart 

von 50 % Formamid hybridisiert . Das Ashbya gossypii RIB1 Gen wird 
als unique Message von etwa 1150 Nukleotiden exprimiert, was In 
beiden Stammen durch eine 0,7 kbp lange Smal-SacI Probe aus d^m 
Plasmid pJR765 (Fig. 8) nachgewiesen wurde. 

45 Analog wurden unique 1900 Nukleotide lange RIB2- , 900 Nukleotide 

JSP ^ ;;nn°° NUkl60tide lange RIB4 -' 1050 Nukleotide 6 
RIB5- und 1000 Nukleotide lange RIB7-Transkri P te in den Blots mit 
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Hilfe eines 0,5 kbp langen Smal-Smal-Fragments aus pJR7 58, eines 
0,6 kbp langen Hindlll-KpnI-Fragments aus pJR790, eines 0,5 kbp 
langen Scal-Hindlll Fragments aus pJR739 und eines 0,3 kbp langen 
Pstl-PstL-Fragments auspJR845 als spezifischer Probe. nachge- 
5 wiesen. 

Beispiel 3 

Expression der Ashbya gossypii RIB-Gene in Saccharomyces 
10 cerevisiae 

Wie in Beispiel 1 beschrieben, konnen gut untersuchte Mutanten 
von Saccharomyces cerevisiae, die in einer Stufe der Riboflavin- 
biosynthese defekt sind, auf Kulturmedien ohne Riboflavin wach- 

15 sen, wenn sie ein Plasmid tragen, das fiir die komplementierenden 
Enzyme von Ashbya codiert. Urn die Funktion der Ashbya gossypii 
RIB Genprodukte zu testen wurden f lavinbildende Enzymaktivitaten 
in zellfreien Extrakten von S. cerevisiae- Mutanten gemessen, die 
eines der Expressionsplasmi.de pJR715 f pJR669, pJR788 r pJR733, 

20 pJR681 und pJR827 trugen. 

Diese in Beispiel 1 beschriebenen von pYEura3 abgeleiteten Plas- 
mide enthaiten Ashbya gossypii RIB-spezif ische cDNA-Fragmente 
unter der Kontfolle des galaktoseinduzierbaren GAL10 Promotors. 

25 

Zellf reie Proteinextrakte von S . cerevisiae wurden aus Kulturen 
gewonnen, die in Flussigmedium bis zu einer optischen Dichte von 
etwa 2 OD gewachsen waren. 

30 Die Zellen wurden geerntet, mit kaltem 20 mM Tris HC1, pH 7,5 
gewaschen und im gleichen Puffer, der mit 1 mM Phenylethylsulf o- 
nylfluorid supplement iert war, resuspendiert . 

Zell-Lysate wurden durch Vortexen in Gegenwart von Glaskugeln und 
35 Zentrifugation bei 3000 g fiir 20 min. bei 4°C hergestellt. 

GTP-Cyclohydrolase II, DRAP-Deaminase, DBP-Synthase, DMRL- Syn- 
thase, Riboflavin-Synthase und HTP-Reduktase Enzymaktivitaten 
wurden bestimmt wie in der Liter at ur beschrieben (Shavlovsky et 

40 al, Arch. Microbiol. 124 1980, 255-259; Richter et al., J. Bace- 
riol. 175, 1993, 4045-4051; Klein und Bacher, Z. Naturforsch. 
35b, 1980, 482-484; Richter et al, J. Bacteriol. 174, 1992, 
4050-4056; Nielsen et al. J. Biol. Chem. 261, 1986, 3661; Plaut 
und Harvey, Methods Enzymol. 18B, 1971, 515-538; Hollander und 

45 Brown, Biochem. Biophys. Res. Commun. 89, 1979, 759-763; Shavlov- 
ski et al., Biochim. Biophys. Acta, 428, 1976, 611-618). 
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Protein- wurde nach der Methode von Peterson quantif iziert (Anal. 
Biochem. 83, 1977, 346-356) . Wie aus Tab. 1 ersichtlich, bewirkt 
.das Plasmid pJR715 die Expression von GTP-Cyclohydrolase II 
Aktivitat in der S. cerevisiae Mutante AJ88. Wei.terhin ist. diese 
5 Aktivitat nur vorhandenin Zellen, die auf Galaktosemedium ge^ 
wachsen sind, was darauf hinweist, daiS die RIB1 cDNA Expression 
von Ashbya gossypii unter der Kontrolle des galaktoseinduzierba- 
ren GALIO-Promotors erf olgt . 

10 Daher belegen diese Ergebnisse, dafl RIB1 fiir die GTP-Cyclohydro- 
lase II in Ashbya gossypii codiert. Auf analoge Art wurde gezeigt 
daJi RIB2 fiir DRAP-Deaminase, RIB3 fiir DBP-Synthase, RIB4 fiir 
DMRL-Synthase, RIBS fiir Ribof lavinsynthase und RIB7 fiir HTP- 
Reduktase in diesem Pilz codiert. 

15 

Tab. 1 

GTP-Cyclohydrolase II Aktivitat der S. cerevisiae RIB1 Mutante 
AJ88 und ihrer Transf ormanden. 



20 



Stamm 


Plasmid 


GTP-Cyclohydrolase II 
U/mg Protein **) 


Glucose 


Galaktose 


X 2180-1A* 




0,48 


0,34 


AJ 88 




n.d. 


n.d. 


AJ 88 


pIR715 


n.d. 


21,60 



n.d.: not detected 
*) Wildtyp 

**) Einheiten GTP-Cyclohydrolase II Aktivitat en 



1U katalysiert die Bildung von 1 nmol HTP pro Stunde 



35 



40 



45 
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Tab 2 

DRAP-Deaminase Aktivitat der S. cerevisiae RIB2 Mutante AJ115 und 

ihrer Transf ormanden . 



Stamm 


Plasmid 


DRAP-Deaminase ' 
U/mg Protein *) 


Glucose 


Galaktose 


X 2180-1A 




0,45 


0,38 


AJ 115 




n.d. 


n.d. 


AJ 115 


pIR669 


n.d. 


53,22 



10 



n.d. : not detected 

*) 1U katalysiert die Bildung von 1 nmol ARAP pro Stunde 



Tab. 3 

15 DBP-Synthase Aktivitat der S. cerevisiae RIB3 Mutante AJ71 und 
ihrer Transf ormanden . 



20 



Stamm 


Plasmid 


DBP-Synthase 
U/mg Protein *) 


Glucose 


Galaktose 


X 2180-1A 




0/80 


0,75 


AJ 71 




n.d. 


n.d. 


AJ 71 


pIR788 


n.d. 


25,19 



25 n.d.: not detected 

*) 1U katalysiert die Bildung von 1 nmol DBP pro Stunde 



Tab. 4 

GTP-Cyclohydrolase II Aktivitat der S. cerevisiae RIB4 Mutante 
30 AJ106 und ihrer Transf ormande. 



35 



Stamm 


Plasmid 


DMRL-Synthase 
U/mg Protein *) 


Glucose 


Galaktose 


X 2180-1A 




2,04 


1,73 


AJ 106 




n.d. 


n.d. 


AJ 106 


pIR733 


n.d. 


86,54 1 



n.d.: not detected 

*) 1U katalysiert die Bildung von 1 nmol DMRL pro Stunde 

40 



45 
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Tab. 5 

Riboflavin-Synthase Aktivitat der S. cerevisiae RIBS Mutante AJ66 
und ihrer Transf ormande . 



5 



Stamm 


* Plasmid ' 


Riboflavin-Synthase 
U/mg Protein *) 


Glucose 


Galactose 


X 2180-1A , 




4, 41 


3,80 


AJ 66 




n.d. 


n.d. 


AJ 66 


pIR681 


n.d. 


164,20 



n.d.: not detected 

*) 1U katalysiert die Bildung von 1 nmol Riboflavin pro Stunde 



Tab. 6 

HTP-Reduktase Aktivitat der S. cerevisiae RIB7 Mutante AJ121 und 
ihrer Transf ormande. 



Stanuri 


Plasmid 


HTP-Reductase 
U/mg Protein *) 


Glucose 


Galaktose 


X 2180-1A 




1,86 


2,54 


A J 121 




n.d. 


n.d. 


AJ 121 


pIR827 


n.d. 


46,21 



25 n.d. : not detected 

*) 10 katalysiert die Bildung von 1 nmol DRAP pro Stunde 



30 



35 



40 



45 



WO 95/26406 PCT/EP95/00958 

14 

SEQUENZPROTOKOLL 

(1) ALGEMEINE INFORMATION: 
* (i) ANMELDER: 

(A) NAME: BASF Aktiengesellschaft . 

(B) STRASSE: Carl-Bosch-Strasse 38 

(C) ORT: Ludwigshaf en 

(E) LAND: Bundesrepublik Deutschland 

(F) POSTLEITZAHL: D-67056 

(G) TELEPHON: 0621/6048526 

(H) TELEFAX: 0621/6043123 

(I) TELEX: 1762175170 

(ii) ANMELDETITEL : Ribof lavin-Biosynthese in Pilzen 
(iii) ANZAHL DER SEQUENZEN: 12 



(iv) COMP UTER- LE S B ARE FORM: 

(A) DATENTRAGER: Floppy disk 

(B) COMPUTER: IBM PC compatible 

(C) BETRIEBSS YSTEM : PC-DOS/MS-DOS 

(D) SOFTWARE: Patentln Release #1.0, Version #1.25 (EPA) 
(2) INFORMATION ZU SEQ ID NO: 1: 

(i) SEQUENZ CHARAKTERISTIKA: " ' fc - 

(A) LANGE: 1329 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Doppel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: cDNS zu mRNS 
(iii) HYPOTHETISCH : NEIN 
(iii) ANT I SENSE : NEIN 

(vi) URSPRiJNLICHE HERKUNFT: 

(A) ORGANISMUS: Ashbya gossypii 

(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: 5'UTR 

(B) LAGE: 1..242 
(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE: 243.. 1148 
(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: 3'UTR 

(B) LAGE: 1149.. 1329 

<xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 1: 
TTTCTGTCCG CATACTTCAT ATGCTCATCG CACATTGATA ATGTACATTC GAAAAATTTC 
AAGATTAGCC TCCGTGAACA GCGATTTACC TTAGGCAAAA GTAACAAAAG GCTTTTCCGT 
AGGTGCTTTG TCATTCAACA ATCCACGTCG GAATTGGCGA CTATATAGTG TAGGGCCCAT 
AAAGCAGTAG TCGGTGTTGA TAGCTGTGTC AGACCAACTC TTTGTTAATT ACTGAAGCTG 
AT ATG ACT GAA TAC ACA GTG CCA GAA GTG AGG TGT GTC GCA CGC GCG 
Met Thr Glu Tyr Thr Val Pro Glu Val Arg Cys Val Ala Arg Ala 
15 10 15 
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CGC ATA CCG~ ACG 
Arg lie Pro Thr 

AAC TCG ATC GAC 
Asn Ser lie Asp 
35 

ATA CGC TCG CGG 
lie Arg Ser Arg 
50 

GCG CGG ATG GTG 
Ala Arg Met Val 
65 

ACC GAG GCA GAC 
Thr Glu Ala Asp 
80 

GAG ACA GGG CAG 
Glu Thr Gly Gin 

CCG ACA CTG GTG 
Pro Thr Levi Val 
115 

TGG AGC GCG CGG 
Trp Ser Ala Arg 
130 

CTG ATG GCT GCG 
Leu Met Ala Ala 
145 

GGC GTG ATC GTG 
Gly Val He Val 
160 

GAG AAG CTG AAG 
Glu Lys Leu Lys 

CAG GCG AAC GAG 
Gin Ala Asn Glu 
195 

TTG GGG CGC GCA 
Leu Gly Arg Ala 
210 

CTC ACG AAT AAC 
Leu Thr Asn Asn 
225 

CTA CGC TGC ATC 
Leu Arg Cys He 
240 



15 

GTA CAG GGC ACC 
Val Gin Gly Thr 
20 

AGC AAG GAA CAC 
Ser Lys Glu His 

AGT CTG TTC CGG 
Ser Leu Phe Arg 
55 

CGG GGC GCC TAC 
Arg Gly Ala Tyr 
70 

GCG GAT CGG CGT 
Ala Asp Arg Arg 
85 

CTG GTG GTG GAG 
Leu Val Val Glu 
100 

CGG CTG CAC TCG 
Arg Leu His Ser 

TGC GAC TGC GGG 
Cys Asp Cys Gly 
135 

GCG ACA GAG GGC 
Ala Thr Glu Gly 
150 

TAC CTG CGG CAG 
Tyr Leu Arg Gin 
165 

GCG TAC AAC CTG 
Ala Tyr Ash Leu 
180 

CTG CTC AAC CAC 
Leu Leu Asn His 

ATC CTA CTG GAC 
He Leu Leu Asp 
215 

CCC GAC AAG GTG 
Pro Asp Lys Val 
230 

GAG CGG GTG CCC 
Glu Arg Val Pro 
245 



GAT GTC TTC CTC 
Asp Val Phe Leu 
25 

CTA GCG ATT GTC 
Leu Ala He Val 
40 

TAC CGG AAA GAC 
Tyr Arg Lys Asp 

GTG GGC CAG CTG 
Val Gly Gin Leu 
75 

CAG GGC CTG GAG 
Gin Gly Leu Glu 
90 

CGG GCG ACG ACG 
Arg Ala Thr Thr 
105 

GAG TGT TAC ACG 
Glu Cys Tyr Thr 
120 

GAG CAG TTC GAC 
Glu Gin Phe Asp 

GAG GTG GTT GGC 
Glu Val Val Gly 
155 

GAG GGC CGC GGC 
Glu Gly Arg Gly 
170 

CAG GAC CTG GGC 
Gin Asp Leu Gly 
185 

CCT GCG GAC GCG 
Pro Ala Asp Ala 
200 

CTC GGT ATC GAG 
Leu Gly He Glu 

CAG CAG GTG CAC 
Gin Gin Val His 
235 

ATG GTG CCG CTT 
Met Val Pro Leu 
250 
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CAT CTA TAC CAC 
His Leu Tyr His 
30 

TTC GpC GAG AAC . 
Phe Gly Glu Asn 
45 

GAC ACG CAG CAG 
Asp Thr Gin Gin 
60 

TAC CCC GGG CGG 
Tyr Pro Gly Arg 

CTG CGG TTT GAT 
Leu Arg Phe Asp 
95 

TGG ACC AGG GAG 
Trp Thr Arg Glu 
110 

GGC GAG ACG GCG 
Gly Glu Thr Ala 
125 

CAG GCG GGT AAG 
Gin Ala Gly Lys 
140 

GGT GCG GGG CAC 
Gly Ala Gly His 

ATC GGG CTA GGC 
He Gly Leu Gly 
175 

GCG GAC ACG GTG 
Ala Asp Thr Val 
190 

CGC GAC TTC TCG 
Arg Asp Phe Ser 
205 

GAC ATC CGG TTG 
Asp He Arg Leu 
220 

TGT CCG CCG GCG 
Cys Pro Pro Ala 

TCA TGG ACT CAG 
Ser Trp Thr Gin 
255 
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CCC ACA CAG" GGC GTG CGC TCG CGC GAG CTG GAC GGC TAC CTG CGC GCC 1055 
Pro Thr Gin Gly Val Arg Ser Arg Glu Leu Asp Gly Tyr Leu Arg Ala 

260 265 270 

AAG GTC GAG CGC ATG-GGG CAC ATG CTG CAG-CGG CCG CTG- GTG CTG CAC . . "1103-' 
Lys Val Glu Arg Met Gly His Met Leu Gin Arg Pro Leu Val Leu His 

275 280 285 

ACG TCT GCG GCG GCC GAG CTC CCC CGC GCC AAC ACA CAC ATA TAATCTTTGC 1155 
Thr Ser Ala Ala Ala Glu Leu Pro Arg Ala Asn Thr His lie 

290 295 300 

TATATTAAAA CTCTATAAAC GTATGCCACA CGGCGCCCGC GGGCTGCCAC ACGCTGCTCA . 1215 
CGGGCTGCCG AACAGTTCTA ACAAGTAATC GCGCGCCTCG CCAGTGATCG TGGCGAGCAC 1275 
CTTGTCGTCC ATCATCACAT ATCCTCGGCT ACAGTCGTCG TTGAAGAGCG TGCA 1329 
(2) INFORMATION ZU SEQ ID NO: 2: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) lANGE: 301 Aminosauren 

(B) ART: Aminosaure 
<D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 2: 
Met Thr Glu Tyr Thr Val Pro Glu Val Arg Cys Val Ala Arg Ala Arg 

1.5 10 15 

lie Pro Thr Val Gin Gly Thr Asp Val Phe Leu His Leu Tyr His Asn 

20 25 30 

Ser lie Asp Ser Lys Glu His Leu Ala lie Val Phe Gly Glu Asn lie 

35 40 45 

Arg Ser Arg Ser Leu Phe Arg Tyr Arg Lys Asp Asp Thr Gin Gin Ala 

50 55 60 

Arg Met Val Arg Gly Ala Tyr Val Gly Gin Leu Tyr Pro Gly Arg Thr 
65 70 75 80 

Glu Ala Asp Ala Asp Arg Arg Gin Gly Leu Glu Leu Arg Phe Asp Glu 

85 90 95 

Thr Gly Gin Leu Val Val Glu Arg Ala Thr Thr Trp Thr Arg Glu Pro 

100 105 110 

Thr Leu Val Arg Leu His Ser Glu Cys Tyr Thr Gly Glu Thr Ala Trp 

115 120 125 

Ser Ala Arg Cys Asp Cys Gly Glu Gin Phe Asp Gin Ala Gly Lys Leu 

130 135 140 

Met Ala Ala Ala Thr Glu Gly Glu Val Val Gly Gly Ala Gly His Gly 
145 150 155 160 

Val He Val Tyr Leu Arg Gin Glu Gly Arg Gly He Gly Leu Gly Glu 

165 170 175 

Lys Leu Lys Ala Tyr Asn Leu Gin Asp Leu Gly Ala Asp Thr Val Gin 

180 185 190 

Ala Asn Glu Leu Leu Asn His Pro Ala Asp Ala Arg Asp Phe Ser Leu 

195 200 205 

Gly Arg Ala He Leu Leu Asp Leu Gly He Glu Asp He Arg Leu Leu 
210 215 220 
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Thr Asn Asrf Pro Asp Lys Val Gin Gin Val His Cys Pro Pro Ala Leu 
225 230 235 240 

Arg Cys lie Glu Arg Val Pro Met Val Pro Leu Ser Trp Thr Gin Pro 
. . 245 : 250 2.55 ' • 

Thr Gin Gly Val Arg Ser Arg Glu Leu Asp Gly Tyr Leu Arg Ala Lys 

260 265 270 

Val Glu Arg Met Gly His Met Leu Gin Arg Pro Leu Val Leu His Thr 

275 280 285 

Ser Ala Ala Ala Glu Leu Pro Arg Ala Asn Thr His lie 

290 295 300 

(2) INFORMATION ZU SEQ ID NO: 3: 
(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 2627 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Doppel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: cDNS zu mRNS 
(iii) HYPOTHETISCH : NEIN 
(iii) ANTISENSE: NEIN 

(vi) URSPRUNLICHE HERKUNFT: 

(A) ORGANISMUS: Ashbya gossypii 

(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: 5'UTR 

(B) LAGE: 1..450 
(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE: 451.. 2280 
(ix) MERKMALE: 

(A) NAME/SCHLIJSSEL: 3'UTR 

(B) LAGE: 2281 2627 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 3: 
CTGCAGGACA ATTTAAATTA CGATTACACG CGGCAGCCTT CTTGGTGCGA CAGGATTTTG 
TACAAGAATG ACCCCAAGCG GGTAAGAGTT CATAGGTATG CCTCGATTGA TAGACGTTCC 
ATTTTGAATT ATACTGATCA CGAACCCGTA ACGCTCGATG TCAGCGTTTC ATGCCATACA 
CAATTTGTCC CAATGGCTAT GCAGAATATT TCCCCACAGA GCACCATGGA AATGTATGTG 
GGAGACGTCA C AG AT AT ACT ACTGATGTTG TTCTCCAGAG TATACTACGC CCCTACCATA 
TTCGATCTTG TGGTATTGAC GATATTCCTC TGTTTGGTTT TACT GGC ACT ATTCCGTTTG 
ACGGTATAGC GCTATTCGTT CATAGTGACA CATGCGGCAC TAGCTATTCA GCGAATCCTT 
TATAAACTGC TACTTAACGT TCGTAACACC ATG CTC AAA GGC GTT CCT GGC CTT 

Met Leu Lys Gly Val Pro Gly Leu 
1 5 
CTT TTT AAG GAG ACG CAA CGT CAT CTG AAA CCC AGG CTG GTT AGG ATT 
Leu Phe Lys Glu Thr Gin Arg His Leu Lys Pro Arg Leu Val Arg lie 

10 15 20 

ATG GAA AAC ACA TCG CAG GAT GAG AGT CGC AAA AGA CAG GTC GCT TCG 
Met Glu Asn Thr Ser Gin Asp Glu Ser Arg Lys Arg Gin Val Ala Ser 
25 30 35 40 
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AAC TTG AGC AGC 
Asn Leu Ser Ser 

GTT AAA ATC ACC 
Val Lys He Thr 
60 

CTA CGG GAC AAA 
Leu Arg Asp Lys 
75 

AAC CGT CAC AGA 
Asn Arg His Arg 
90 

CCG ATG CGC AAG 
Pro Met Arg Lys 
105 

AAG GAG CGC TGG 
Lys Glu Arg Trp 

TTT CGG GAC CGC 
Phe Arg Asp Arg 
140 

GGT GTG CTC CTG 
Gly Val Leu Leu 
155 

AAT GGA GAC CTC 
Asn Gly Asp Leu 
170 

TCC TCT AGG CCG 
Ser Ser Arg Pro 
185 

ATT GAC AAG CCC 
He Asp Lys Pro 

TTC AAC TCC ATT 
Phe Asn Ser He 
220 

CAT CCA TGT AAC 
His Pro Cys Asn 
235 

GCA AAA ACT CCA 
Ala Lys Thr Pro 
250 

CGC GAA GTG AAG 
Arg Glu Val Lys 
265 
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GAT GCC GAT GAG 
Asp Ala Asp Glu 
45 

AAA CGC CTC AGG 
Lys Arg Leu Arg 

GCA GGA TTC AAG 
Ala Gly Phe Lys 
80 

CAG GTC GAT CCG 
Gin Val Asp Pro 
95 

ATC AAA CCG TAT 
He Lys Pro Tyr 
110 

AGA GAT CGG AAG 
Arg Asp Arg Lys 
125 

GAT AGG CCT TAC 
Asp Arg Pro Tyr 

AAC GGT AAG TCA 
Asn Gly Lys Ser 
160 

ATT TCG CAC GAG 
He Ser His Glu 
175 

ATT AGG ACG GTG 
He Arg Thr Val 
190 

AGC GGG ATT CCA 
Ser Gly He Pro 
205 

ACG AAA ATA CT7 
Thr Lys He Leu 

CGA CTG GAC CGC 
Arg Leu Asp Arg 
240 

AAG GGA GCC GAT 
Lys Gly Ala Asp 
255 

AAA GAA TAT GTT 
Lys Glu Tyr Val 
270 



GGC TCG CCG GCA 
Gly Ser Pro Ala 
50 

AAG AAG AAC CTC 
Lys Lys Asn Leu 
65 

TTG AAG GTG CAA 
Leu Lys Val Gin 

GAA TAC GAA GTC 
Glu Tyr Glu Val 
100 

TTC TTC ACA TAC 
Phe Phe Thr Tyr 
115 

TTG CTT GAT GTG 
Leu Leu Asp Val 
130 

TAC GAG AAA GTC 
Tyr Glu Lys Val 
145 

TCG ACG TTA GAT 
Ser Thr Leu Asp 

CTG CAC CGT CAT 
Leu His Arg His 
180 

TAC GAA GAT GAT 
Tyr Glu Asp Asp 
195 

GCC CAT CCC ACC 
Ala His Pro Thr 
210 

GAA AAA CAG CTT 
Glu Lys Gin Leu 
225 

CTA ACC AGT GGC 
Leu Thr Ser Gly 

GAG ATG GGT GAT 
Giu Met Gly Asp 
260 

GCC CGG GTT GTT 
Ala Arg Val Val 
275 
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GTT ACG AGG CCG 
Val Thr Arg Pro 
55 

.GGG ACA GGC GAG . 
Gly Thr Gly Glu 
70 

GAC GTG AGC AAA 
Asp Val Ser Lys 
85 

GTG GTA GAT GGC 
Val Val Asp Gly 

AAG ACT TTC TGC 
Lys Thr Phe Cys 
120 

TTT GTG GAT GAA 
Phe Val Asp Glu 
135 

ATC GGT TCG GGT 
He Gly Ser Gly 
150 

AGC GTA TTG CGT 
Ser Val Leu Arg 
165 

GAG CCA CCG GTC 
Glu Pro Pro Val 

GAC ATC CTG GTG 
Asp He Leu Val 
200 

GGG CGT TAC CGC 
Gly Arg Tyr Arg 
215 

GGA TAC ACT GTT 
Gly Tyr Thr Val 
230 

CTA ATG TTC TTG 
Leu Met Phe Leu 
245 

CAG ATG AAG GCG 
Gin Met Lys Ala 

GGG GAA TTT CCT 
Gly Glu Phe Pro 
280 
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ATA GGT GAG* ATA GTT GTG GAT ATG CCA CTG AAG ACT ATA GAG CCG AAG 1338 
He Gly Glu He Val Val Asp Met Pro Leu Lys Thr He Glu Pro Lys 

285 290 295 

CTT GCC CTA AAC ATG GTT TGC GAC CCG GAA GAC GAA GCG GGC AAG GGC ■ . 1386- • 
Leu Ala Leu Asn Met Val Cys Asp Pro Glu Asp Glu Ala Gly Lys Gly 

300 305 310 

GCT AAG ACG CAG TTC AAA AGA ATC AGC TAC GAT GGA CAA ACG AGC ATA 1434 
Ala Lys Thr Gin Phe Lys Arg He Ser Tyr Asp Gly Gin Thr Ser He 

315 320 325 

GTC AAG TGC CAA CCG TAC ACG GGC CGG ACG CAT CAG ATC CGT GTT CAC 1482 
Val Lys Cys Gin Pro Tyr Thr Gly Arg Thr His Gin He Arg Val His 

330 335 340 

TTG CAA TAC CTG GGC TTC CCA ATT GCC AAC GAT CCG ATT TAT TCC AAT 1530 
Leu Gin Tyr Leu Gly Phe Pro He Ala Asn Asp Pro He Tyr Ser Asn 
345 350 355 360 

CCG CAC ATA TGG GGC CCA AGT CTG GGC AAG GAA TGC AAA GCA GAC TAC 1578 
Pro His He Trp Gly Pro Ser Leu Gly Lys Glu Cys Lys Ala Asp Tyr 

365 370 375 

AAG GAG GTC ATC CAA AAA CTA AAC GAA ATT GGT AAG ACT AAA TCT GCG 1626 
Lys Glu Val He Gin Lys Leu Asn Glu He Gly Lys Thr Lys Ser Ala 

380 385 390 

GAA AGT TGG TAC CAT TCT GAT TCC CAA GGT GAA GTT TTC AAA GGG GAA 1674 
Glu Ser Trp Tyr His Ser Asp Ser Gin Gly Glu Val Phe Lys- Gly Glu 

395 400 405 

CAA TGC GAT GAA TGT GGC ACC GAA CTG TAC ACT GAC CCG GGC CCG AAT 1722 
Gin Cys Asp Glu Cys Gly Thr Glu' Leu Tyr Thr Asp Pro Gly Pro Asn 

410 415 420 

GAT CTT GAC TTA TGG TTG CAT GCA TAT CGG TAT GAA TCC ACT GAA CTG 1770 
Asp Leu Asp Leu Trp Leu His Ala Tyr Arg Tyr Glu Ser Thr Glu Leu 
425 430 435 440 

GAT GAG AAC GGT GCT AAA AAG CGG AGT TAC TCT ACT GCG TTT CCT GAG 1818 
Asp Glu Asn Gly Ala Lys Lys Arg Ser Tyr Ser Thr Ala Phe Pro Glu 

445 450 455 

TGG GCT CTT GAG CAG CAC GGC GAC TTC ATG CGG CTT GCC ATC GAA CAG 1866 
Trp Ala Leu Glu Gin His Gly Asp Phe Met Arg Leu Ala He Glu Gin 

460 465 470 

GCT AAG AAA TGC CCA CCC GCG AAG AC A TCA TTT AGC GTT GGT GCC GTG 1914 
Ala Lys Lys Cys Pro Pro Ala Lys Thr Ser "Phe Ser Val Gly Ala Val 

475 480 485 

TTA GTT AAT GGG ACC GAG ATT TTG GCC ACT GGT TAC TCA CGG GAG CTG 1962 
Leu Val Asn Gly Thr Glu He Leu Ala Thr Gly Tyr Ser Arg Glu Leu 

490 495 500 

GAA GGC AAC ACG CAC GCT GAA CAA TGT GCA CTT CAA AAA TAT TTT GAA 2010 
Glu Gly Asn Thr His Ala Glu Gin Cys Ala Leu Gin Lys Tyr Phe Glu 
505 510 515 520 
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CAA CAT AAA" ACC GAC AAG GTT CCT ATT GGT ACA GTA ATA TAC ACG ACT 2058 
Gin His Lys Thr Asp Lys Val Fro lie Gly Thr Val lie Tyr Thr Thr 

525 530 535 

ATG.GAG CCT TGT TCT CTC CGT CTC AGT GGT AAT. AAA CCG TGT GTT .GAG . ,2106* 
Met Glu Pro Cys Ser Leu Arg Leu Ser Gly Asn Lys Pro Cys Val Glu 

540 545 550 

CGT ATA ATC TGC CAG CAG GGT AAT ATT ACT GCT GTT TTT GTT GGC GTA 2154 
Arg He He Cys Gin Gin Gly Asn He Thr Ala Val Phe Val Gly Val 

555 560 565 

CTT GAG CCA GAC AAC TTC GTG AAG AAC AAT ACA AGT CGT GCG CTA TTG 2202 
Leu Glu Pro Asp Asn Phe Val Lys Asn Asn Thr Ser Arg Ala Leu Leu 

570 575 580 

GAA CAA CAT GGT ATA GAC TAT ATT CTT GTC CCT GGG TTT CAA GAA GAA 2250 
Glu Gin His Gly He Asp Tyr He Leu Val Pro Gly Phe Gin Glu Glu 
585 590 595 600 

TGT ACT GAA GCC GCA TTG AAG GGT CAT TGATTTTGCT GCGAATTGTA 2297 
Cys Thr Glu Ala Ala Leu Lys Gly His 

605 610 
GATGACTTAA AATATCGAGG CGTATAATTC GTCGCATTTT ATATAGTTAT CTATGTTTAC 2357 
ATGACTGTTT AAGCTTGATC TATATTTCTC AAGTGAATTG CCACATATGT TGGTACGGTA 2417 
ATAAATTAAT GAGGGAGTTT TGAAATTCGC AACCAATCTT ATATACGTTT GATGATATAA 2477 
ACGGATTGAG ATTCATTAAG CTACCTGATT TTCGCTGAAC TGTTTGTTAT AGGTTTTTAC 2537 
AGTAAGATAG TTCCTAAGTT TGTTTATTGT CCCCAGTCGG CCAATTGTTC CGGACTTATT 2597 
ATTATTACCA TTAGTGGTGT TAGTAGTATT 2627 
(2) INFORMATION ZU SEQ ID NO: 4: 

(i) SEQUENZ CHARAKTERI ST IKA : 

(A) LANGE: 609 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 4: 
Met Leu Lys Gly Val Pro Gly Leu Leu Phe Lys Glu Thr Gin Arg His 

15 10 15 

Leu Lys Pro Arg Leu Val Arg He Met Glu Asn Thr Ser Gin Asp Glu 

20 25 30 

Ser Arg Lys Arg Gin Val Ala Ser Asn Leu Ser Ser Asp Ala Asp Glu 

35 40 45 

Gly Ser Pro Ala Val Thr Arg Pro Val Lys He Thr Lys Arg Leu Arg 

50 55 60 

Lys Lys Asn Leu Gly Thr Gly Glu Leu Arg Asp Lys Ala Gly Phe Lys 
65 70 75 80 

Leu Lys Val Gin Asp Val Ser Lys Asn Arg His Arg Gin Val Asp Pro 

85 90 95 

Glu Tyr Glu Val Val Val Asp Gly Pro Met Arg Lys He Lys Pro Tyr 

100 105 110 

Phe Phe Thr Tyr Lys Thr Phe Cys Lys Glu Arg Trp Arg Asp Arg Lys 
115 120 125 
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Leu Leu Asp" Val Phe Val Asp Glu Phe Arg Asp Arg Asp Arg Pro Tyr 

130 135 140 

Tyr Glu Lys Val He Gly Ser Gly Gly Val Leu LeuAsn Gly Lys Ser 
14.5 • , 150 . 155 160 • 

Ser Thr Leu Asp Ser Val Leu Arg Asn Gly Asp Leu lie Ser His Glu 

165 170 175 

Leu His Arg His Glu Pro Pro Val Ser Ser Arg Pro He Arg Thr Val 

180 185 190 

Tyr Glu Asp Asp Asp He Leu Val He Asp Lys Pro Ser Gly He Pro 

195 200 205 

Ala His Pro Thr Gly Arg Tyr Arg Phe Asn Ser He Thr Lys lie Leu 

210 215 220 

Glu Lys Gin Leu Gly Tyr Thr Val His Pro Cys Asn Arg Leu Asp Arg 
225 230 235 240 

Leu Thr Ser Gly Leu Met Phe Leu Ala Lys Thr Pro Lys Gly Ala Asp 

245 250 255 

Glu Met Gly Asp Gin Met Lys Ala Arg Glu Val Lys Lys Glu Tyr Val 

260 265 270 

Ala Arg Val Val Gly Glu Phe Pro He Gly Glu He Val Val Asp Met 

275 280 285 

Pro Leu Lys Thr lie Glu Pro Lys Leu Ala Leu Asn Met Val Cys Asp 

290 295 300 

Pro Glu Asp Glu Ala Gly Lys Gly Ala Lys Thr Gin Phe Lys Arg He 
305 310 315 320 

Ser Tyr Asp Gly Gin Thr Ser He Val Lys Cys Gin Pro Tyr Thr Gly 

325 330 335 

Arg Thr His Gin He Arg Val His Leu Gin Tyr Leu Gly Phe Pro He 

340 345 350 

Ala Asn Asp Pro He Tyr Ser Asn Pro His He Trp Gly Pro Ser Leu 

355 360 365 

Gly Lys Glu Cys JLys Ala Asp Tyr Lys Glu Val He Gin Lys Leu Asn 

370 375 380 

Glu He Gly Lys Thr Lys Ser Ala Glu Ser Trp Tyr His Ser Asp Ser 
385 390 395 400 

Gin Gly Glu Val Phe Lys Gly Glu Gin Cys Asp Glu Cys Gly Thr Glu 

405 410 415 

Leu Tyr Thr Asp Pro Gly Pro Asn Asp Leu Asp Leu Trp Leu His Ala 

420 425 430 

Tyr Arg Tyr Glu Ser Thr Glu Leu Asp Glu Asn Gly Ala Lys Lys Arg 

435 440 445 

Ser Tyr Ser Thr Ala Phe Pro Glu Trp Ala Leu Glu Gin His Gly Asp 

450 455 460 

Phe Met Arg Leu Ala He Glu Gin Ala Lys Lys Cys Pro Pro Ala Lys 
465 470 475 480 

Thr Ser Phe Ser Val Gly Ala Val Leu Val Asn Gly Thr Glu He Leu 
485 490 495 
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Ala Thr Gly Tyr Ser Arg Glu Leu Glu Gly Asn Thr His 

500 505 
Cys Ala Leu Gin Lys Tyr Phe Glu Gin His Lys Thr Asp 
515 520 525 

lie Gly Thr Val He Tyr Thr Thr Met Glu Pro Cys Ser 

530 535 540 

Ser Gly Asn Lys Pro Cys Val Glu Arg He He Cys Gin 
545 550 555 

He Thr Ala Val Phe Val Gly Val Leu Glu Pro Asp Asn 

565 570 
Asn Asn Thr Ser Arg Ala Leu Leu Glu Gin His Gly He 

580 585 
Leu Val Pro Gly Phe Gin Glu Glu Cys Thr Glu Ala Ala 
595 600 605 

His 

(2) INFORMATION ZU SEQ ID NO: 5: 
(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 1082 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Doppel 

(D) TOPOLOGIE; linear 
<ii) ART DES MOLEKOLS: cDNS zu mRNS 

(iii) HYPOTHETISCH: NEIN 
(iii) ANTISENSE: NEIN 

(vi) URSPRONLICHE HERKUNFT:' 

(A) ORGANISMUS: Ashbya gossypii 

(ix) MERKMALE: 

(A) NAME/ SCHLUSSEL : 5'UTR 

(B) LAGE: 1..314 
(ix) MERKMALE: 

(A) NAME /SCHLUSSEL: CDS 

(B) LAGE: 315.. 953 
(ix) MERKMALE: 

(A) NAME / SCHLtiS SEL : 3'UTR 

(B) LAGE: 954.. 1082 
(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 5: 

CCCTTCTTGC ACGGTCGTTT CTGAAACTCT ACGATTATTG GAACAATGAG TAAGTCCTCA 
AATGTACCAC CTATCTGTAG TTTACTATCG GATTTACTGG CTAAGAGCTG ACCTGTTAGG 
CAAGTGAAAC ATATCACATC GCCAGCAGGT TGGGCTACCA AGGATAGTTG ATGACTTCCA 
TCACCTATAA AAGCGGCTTG AGTGCTTTTG CAATGATTCT GTTCACATGA TGGACAAGAA 
ATACGTACAA AAATTTCAAC GTTTTACAAG TTCCCAAGCT TAGTCAACTC ATCACCAACG 
ACAAACCAAG CAAC ATG ACA AGC CCA TGC ACT GAT ATC GGT ACC GCT ATA 
Met Thr Ser Pro Cys Thr Asp He Gly Thr Ala He 
1 5 10 



Ala Glu Gin 
510 

Lys Val Pro 

Leu Arg Leu 

Gin Gly Asn 
560 

Phe Val Lys 

575 
Asp Tyr He 
590 

Leu Lys Gly 
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GAG CAG TTC AAG CAA AAT AAG ATG ATC ATC GTC ATG GAC CAC ATC TCG 398 
Glu Gin Phe Lys Gin Asn Lys Met He He Val Met Asp His He Ser 

15 20 25 

AGA GAA AAC GAG GCC. GAT CTA ATA TGT GCA GCA GCG CAC ATG ACT GCC ...456 ' 

Arg Glu Ash Glu Ala Asp Leu lie Cys Ala Ala Ala His Met Thr Ala 

30 35 40 

GAG CAA ATG GCA TTT ATG ATT CGG TAT TCC TCG GGC TAC GTT TGC GCT 494 
Glu Gin Met Ala Phe Met He Arg Tyr Ser Ser Gly Tyr Val Cys Ala 
45 50 55 60 

CCA ATG ACC AAT GCG ATT GCC GAT AAG CTA GAC CTA CCG CTC ATG AAC 542 
Pro Met Thr Asn Ala He Ala Asp Lys Leu Asp Leu Pro Leu Met Asn 

65 70 75 

ACA TTG AAA TGC AAG GCT TTC TCC GAT GAC AGA CAC AGC ACT GCG TAT 590 
Thr Leu Lys Cys Lys Ala Phe Ser Asp Asp Arg His Ser Thr Ala Tyr 

80 85 90 

ACA ATC ACC TGT GAC TAT GCG CAC GGG ACG ACG ACA GGT ATC TCC GCA 638 
Thr He Thr Cys Asp Tyr Ala His Gly Thr Thr Thr Gly He Ser Ala 

95 100 ' 105 

CGT GAC CGG GCG TTG ACC GTG AAT CAG TTG GCG AAC CCG GAG TCC AAG 686 
Arg Asp Arg Ala Leu Thr Val Asn Gin Leu Ala Asn Pro Glu Ser Lys 

110 115 120 

GCT ACC GAC TTC ACG AAG CCA GGC CAC ATT GTG CCA TTG CGT GCC CGT 734 
Ala Thr Asp Phe Thr Lys Pro Gly His He Val Pro Leu Arg Ala Arg 
125 130 135 140 

GAC GGC GGC GTG CTC GAG CGT GAC GGG CAC ACC GAA GCG GCG CTC GAC 782 
Asp Gly Gly Val Leu Glu Arg Asp Gly His Thr Glu Ala Ala Leu Asp 

145 150 155 

TTG TGC AGA CTA GCG GGT GTG CCA GAG GTC GCT GCT ATT TGT GAA TTA 830 
Leu Cys Arg Leu Ala Gly Val Pro Glu Val Ala Ala He Cys Glu Leu 

160 165 170 

GTA AGC GAA AGG GAC GTC GGG CTG ATG ATG ACT TTG GAT GAG TGT ATA 878 
Val Ser Glu Arg Asp Val Gly Leu Met Met Thr Leu Asp Glu Cys He 

175 180 185 

GAA TTC AGC AAG AAG CAC GGT CTT GCC CTC ATC ACC GTG CAT GAC CTG 926 
Glu Phe Ser Lys Lys His Gly Leu Ala Leu He Thr Val His Asp Leu 

190 195 200 

AAG GCT GCA GTT GCC GCC AAG CAG TAGACGGCAA CGAGTTCTTT AAGTCGGTGT 980 
Lys Ala Ala Val Ala Ala Lys Gin 
205 210 

TCATTTATGT AATATACCAT TTCATCGAAA AAGTCAAATG GTATGAACTA GATTTATCAA 1040 
TAGTATCTAA GAGTTATGGT ATTCGCAAAA GCTTATCGAT AC 1082 
(2) INFORMATION ZU SEQ ID NO: 6: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) iANGE: 212 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKtiLS : Protein 
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<xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 6: 
Met Thr Ser Pro Cys Thr Asp He Gly Thr Ala He Glu Gin Phe Lys 
1 5 10 15 

.Girt Asn Lys Met He He Val Met- Asp His He Ser Arg Glu Asn Glu 

20 * 25 30 

Ala Asp Leu lie Cys Ala Ala Ala His Met Thr Ala Glu Gin Met Ala 

35 40 45 

Phe Met He Arg Tyr Ser Ser Gly Tyr Val Cys Ala Pro Met Thr Asn 

50 55 60 

Ala He Ala Asp Lys Leu Asp Leu Pro Leu Met Asn Thr Leu Lys Cys 
65 70 75 80 

Lys Ala Phe Ser Asp Asp Arg His Ser Thr Ala Tyr Thr He Thr Cys 

85 90 95 

Asp Tyr Ala His Gly Thr Thr Thr Gly He Ser Ala Arg Asp Arg Ala 

100 105 HQ 

Leu Thr Val Asn Gin Leu Ala Asn Pro Glu Ser Lys Ala Thr Asp Phe 

115 120 125 

Thr Lys Pro Gly His He Val Pro Leu Arg Ala Arg Asp Gly Gly Val 

130 * 135 140 

Leu Glu Arg Asp Gly His Thr Glu Ala Ala Leu Asp Leu Cys Arg Leu 
145 150 155 160 

Ala Gly Val Pro Glu Val Ala Ala He Cys Glu Leu Val Ser Glu Arg 

165 170 - 175 

Asp Val Gly Leu Met Met Thr Leu Asp Glu Cys He Glu Phe Ser Lys 

180 185 190 

Lys His Gly Leu Ala Leu He Thr Val His Asp Leu Lys Ala Ala Val 

195 200 205 

Ala Ala Lys Gin 
210 

(2) INFORMATION ZU SEQ ID NO: 7: 
(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 996 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Doppel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: cDNS zu mRNS 
(iii) HYPOTHETISCH: NEIN 
(iii) ANTISENSE: NEIN 

(vi) URSPRUNLICHE HERKUNFT: 

(A) ORGANISMUS: Ashbya gossypii 

(ix) MERKMALE: 

(A) NAME/SCHLUSSEL : 5'UTR 

(B) LAGE: 1..270 
{ix) MERKMALE: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE: 271. .789 
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(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: 3'UTR 

(B) LAGE: 790. .996 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: -7: 
TGGTATAATG ATACAGGAAG TGAAAATCCG AAAGGTTCAG ACGATGAAAA GAGTTTGAGA 
CGCATCAATG ATCAGCTTTG AGCTATATGT AAGTCTATTA ATTGATTACT AATAGCAATT 
TATGGTATCC TCTGTTCTGC ATATCGACGG TTCTCACGTG ATGATCAGCT TGAGGCTTCG 
CGGATAAAGT TCCATCGATT ACTATAAAAC CATCACATTA AACGTTCACT ATAGGCATAC 
ACACAGACTA AGTTCAAGTT AGCAGTGACA ATG ATT AAG GGA TTA GGC GAA GTT 



Met He Lys Gly Leu Gly Glu Val 
1 5 



GAT 


CAA 


ACC 


TAG 


GAT 


GCG 


AGC 


TCT 


GTC GAG 


GTT 


GGC 


ATT 


GTC 


CAC 


GCG 


Asp 


Gin 
10 


Thr 


Tyr 


Asp 


Ala 


Ser 
15 


Ser 


Val Glu 


Val 


Gly 
20 


He 


Val 


His 


Ala 


AGA 


TGG 


AAC 


AAG 


ACT 


GTC 


ATT 


GAC 


GCT CTC 


GAC 


CAA 


GGT 


GCA 


ATT 


GAG 


Arg 


Trp 


Asn 


Lys 


Thr 


Val 


He 


Asp 


Ala Leu 


Asp 


Gin 


Gly 


Ala 


lie 


Glu 


25 










30 








35 










40 


AAA 


CTG 


CTT 


GCT 


ATG 


GGA 


GTG 


AAG 


GAG AAG 


AAT 


ATC 


ACT 


GTA 


AGC 


ACC 


Lys 


Leu 


Leu 


Ala 


Met 
45 


Gly 


Val 


Lys 


Glu Lys 
50 


Asn 


He 


Thr 


Val 


Ser 
55 


Thr 


GTT 


CCA 


GGT 


GCG 


TTT 


GAA 


CTA 


CCA 


TTT GGC 


ACT 


CAG 


CGG 


TTT 


GCC 


GAG 


Val 


Pro 


Gly 


Ala 
60 


Phe 


Glu 


Leu 


Pro 


Phe Gly 
65 


Thr 


Gin 


Arg 


Phe 
70 


Ala 


Glu 


CTG 


ACC 


AAG 


GCA 


AGT 


GGC 


AAG 


CAT 


TTG GAC 


GTG 


GTC 


ATC 


CCA 


ATT 


GGA 


Leu 


Thr 


Lys 
75 


Ala 


Ser 


Gly 


Lys 


His 
80 


Leu Asp 


Val 


Val 


He 
85 


Pro 


He 


Gly 


GTC 


CTG 


ATC 


AAA 


GGC 


GAC 


TCA 


ATG 


CAC TTT 


GAA 


TAT 


ATA 


TCA 


GAC 


TCT 


Val 


Leu 
90 


lie 


Lys 


Gly 


Asp 


Ser 
95 


Met 


His Phe 


Glu 


Tyr 
100 


He 


Ser 


Asp 


Ser 


GTG 


ACT 


CAT 


GCC 


TTA 


ATG 


AAC 


CTA 


CAG AAG 


AAG 


ATT 


CGT 


CTT 


CCT 


GTC 


Val 


Thr 


His 


Ala 


Leu 


Met 


Asn 


Leu 


Gin Lys 


Lys 


He 


Arg 


Leu 


Pro 


Val 


105 










110 








115 










120 


ATT 


TTT 


GGT 


TTG 


CTA 


ACG 


TGT 


CTA 


ACA GAG 


GAA 


CAA 


GCG 


TTG 


ACA 


CGT 


He 


Phe 


Gly 


Leu 


Leu 
125 


Thr 


Cys 


Leu 


Thr Glu 
130 


Glu 


Gin 


Ala 


Leu 


Thr 
135 


Arg 


GCA 


GGC 


CTC 


GGT 


GAA 


TCT 


GAA 


GGC 


AAG CAC 


AAC 


CAC 


GGT 


GAA 


GAC 


TGG 


Ala 


Gly 


Leu 


Gly 
140 


Glu 


Ser 


Glu 


Gly 


Lys His 
145 


Asn 


His 


Gly 


Glu 
150 


Asp 


Trp 


GGT 


GCT 


GCT 


GCC 


GTG 


GAG 


ATG 


GCT 


GTA AAG 


TTT 


GGC 


CCA 


CGC 


GCC 


GAA 


Gly 


Ala 


Ala 
155 


Ala 


Val 


Glu 


Met 


Ala 
160 


Val Lys 


Phe 


Gly 


Pro 
165 


Arg 


Ala 


Glu 



CAA ATG AAG AAG TGAATATTAA AAAATCACTA CTTAAAATTA ACGTTTTTAT 



Gin Met Lys Lys 
170 

TATGTCTATA TCAAATTCTT ACGTGATAAC TTTTGATTTC GCTTCCTGGA TTGGCGCAAG 
GCCTCCCTGT GTCGCAGTTT TTGTTCACGG GTCCACACAG CTCTGTTTTC CCAGAACATA 
TCCTCCCAGC CGGCGAACCG GTTAGACGCT TCTGCTGGCG TTCTTATTTT 
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(2) INFORMATION ZU SEQ ID NO: 8: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 172 Aminosauren 

(B) ART: Aminosaure 

(D) TOPOLOGIE: linear " " " ' 

(ii) ART DES MOLEKULS: Protein 
(xi) SEQDENZBESCHREIBUNG: SEQ ID NO- 8- 
Met lie Lys Gly Leu Gly Glu Val Asp Gln' T hr Tyr Asp Ala Ser Ser 

5 10 15 



Val Glu val Gly He Val His Ala Arg Trp Asn Lys Thr Val Al Asp 
Ala Leu Asp Gin Gly Ala He Glu Lys' Leu Leu Ala Met Gly" Val Lys 
Glu Lys Asn lie Thr V al Ser Thr Val Pro Gly Ala Phe Glu Leu Pro 
Phe Gly Th r Gin Ar g Phe Al" Glu Leu Thr Lys Ala" Ser Gly Lys His 
Leu Asp Val Val lie Pro lie Gly Val Leu £ Lys Gly Asp Ser Me" 
His P , e Giu * Ile SeE ssp set val au HM J5 

105 

»» Vn Lys He Ar, ^ Pto Ile W e Gly Le „ ^ £ Cys Leu 
«. Glu eln Ma ^ ™ iU My £ ^ 

135 -j^^q 
Lys His Asn His Gly Glu Asp Trp Gly Ala Ala Ala Val Glu Met Ala 



150 155 
Val Lys Phe Gly Pro Arg Ala Glu Gin Met Lys Lys 

165 17Q 
(2) INFORMATION ZU SEQ ID NO: 9: 
(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 1511 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Doppel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: cDNS zu mRNS 
(iii) HYPOTHETISCH: NEIN 
(iii) ANTISENSE: NEIN 

(vi) URSPRUNLICHE HERKUNFT: 

(A) ORGANISMUS: Ashbya gossypii 

(ix) MERKMALE: 

(A) NAME/ SCHLUSSEL : 5'UTR 

(B) LAGE: 1. .524 
(ix) MERKMALE: 

(A) NAME /SCHLUSSEL: CDS 

(B) LAGE: 525. .1232 



160 
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(ix) MERKMALE: 

(A) NAME/ SCHLUSSEL : 3'UTR 
<B) LAGE: 1233. ,1511 
- . . (xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 9:". 

TGTATTCAAC CTGGAGGATA ACGAAATTTC CATGGCGCGG GCGATACCAA CCCACAGGAG 
CCAGATATAA GACCAATCCC GGCGGGTGTG CCAGCCGCCA TC AG AG AC AG CGGGCCAGCA 
AGGCATGTGA AGTCAAAAGG CGCCAGCTCC TTATCCGCTC CCGCACAAGC AGGACCGGCA 
TATCCCGATG AGCGCGCCAG CACCCAGACG CTACACCACC ATTCGAAGTA GACTTTAAAA 
GAGCGCTTTC CAGCTTCTCA GGCAGTTAGC TCTACGACAA AGGAACCAAG TGATTTTCCC 
GATAGACGCG ACTTGCTCAA CGATGTTTCT GTGACCAGCG CAAGGAGAGA TAGTCCTAAA 
GTATAATCAG ATAGTTAGTC GTATCTTCTA GTTTTATTAG TCAGCTACAT GGCGAACCGC 
CATTTCCTTA TGCATGTCTT ACGAGTTTAA AAAGCTCGCG GTAGCAGAAA AGAAGATGCA 
TAGATGGCAT ACCGAAGCCT ATATCGCCCA TAGAAGTTGA TAGG ATG TTT ACC GGT 

Met Phe Thr Gly 
1 

ATA GTG GAA CAC ATT GGC ACT GTT GCT GAG TAG TTG GAG AAC GAT GCC 
lie Val Glu His lie Gly Thr Val Ala Glu Tyr Leu Glu Asn Asp Ala 
5 10 15 20 

AGC GAG GCA GGC GGC AAC GGT GTG TCA GTC CTT ATC AAG GAT GCG GCT 
Ser Glu Ala Gly Gly Asn Gly Val Ser Val Leu lie Lys Asp Ala Ala 

25 30 35 

CCG ATA CTG GCG GAT TGC CAC ATC GGT GAC TCG ATT GCA TGC AAT GGT 
Pro lie Leu Ala Asp Cys His lie Gly Asp Ser lie Ala Cys Asn Gly 

40 45 50 

ATC TGC CTG ACG GTG ACG GAG TTC ACG GCC GAT AGC TTC AAG GTC GGG 
lie Cys Leu Thr Val Thr Glu Phe Thr Ala Asp Ser Phe Lys Val Gly 

55 60 65 

ATC GCA CCA GAA ACA GTT TAT CGG ACG GAA GTC AGC AGC TGG AAA GCT 
lie Ala Pro Glu Thr Val Tyr Arg Thr Glu Val Ser Ser Trp Lys Ala 

70 75 80 

GGC TCC AAG ATC AAC CTA GAA AGG GCC ATC TCG GAC GAC AGG CGC TAC 
Gly Ser Lys lie Asn Leu Glu Arg Ala lie Ser Asp Asp Arg Arg Tyr 
85 90 95 100 

GGC GGG CAC TAC GTG CAG GGC CAC GTC GAC TCG GTG GCC TCT ATT GTA 
Gly Gly His Tyr Val Gin Gly His Val Asp Ser Val Ala Ser He Val 

105 110 115 

TCC AGA GAG CAC GAC GGG AAC TCT ATC AAC TTT AAG TTT AAA CTG CGC 
Ser Arg Glu His Asp Gly Asn Ser He Asn Phe Lys Phe Lys Leu Arg 

120 125 130 

GAT CAA GAG TAC GAG AAG TAC GTA GTA GAA AAG GGT TTT GTG GCG ATC 
' Asp Gin Glu Tyr Glu Lys Tyr Val Val Glu Lys Gly Phe Val Ala He 
135 140 145 

GAC GGT GTG TCG CTG ACT GTA AGC AAG ATG GAT CCA GAT GGC TGT TTC 
Asp Gly Val Ser Leu Thr Val Ser Lys Met Asp Pro Asp Gly Cys Phe 
150 155 160 
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TAC ATC TCG ATG ATT GCA CAC ACG CAG ACC GCT GTA GCC* CTT CCA CTG 
Tyr lie Ser Met He Ala His Thr Gin Thr Ala Val Ala Leu Pro Leu 
165 170 - 175 180 

AAG CCG GAC.GGX GCC CTC GTG AAC ATA GAA ACG GAT GTT AAC'GGCAAG . 
Lys Pro Asp Gly Ala Leu Val Asn He Glu Thr Asp Val Asn Gly Lys 

185 190 195 

CTA GTA GAG AAG CAG GTT GCA CAG TAC CTG AAT GCG CAG CTG GAA GGT 
Leu Val Glu Lys Gin Val Ala Gin Tyr Leu Asn Ala Gin Leu Glu Gly 

200 205 210 

GAG AGC TCG CCA TTG CAG CGC GTG CTC GAA AGG ATT ATT GAA TCC AAG 
Glu Ser Ser Pro Leu Gin Arg Val Leu Glu Arg He He Glu Ser Lys 

215 220 225 

CTT GCT AGC ATC TCA AAT AAG TGATTATATT ATCTTGGGTG CTGTATATCT 
Leu Ala Ser He Ser Asn Lys 
230 235 
TATGTATGTC TTACGACTGT GAATCAGAGG GGTGGCAGCT GGAACACCAG CGACACACCT 
TdGTCTCCCG CGGTGATCAG CCTTCTGTTT TCCTCAAGTA GTACAAAGTC TAGGACACCC 
TGTTGTGGCC AACGCAAACA TGGAGCTGCT GCCCGTTACG CACGTCGAAC TCGTAGACCT 
TGCCGTCAAT' GC ACG AG GCG AACAGGTGGA AACCGGTGGT CTTGTCAAAC CGCCAGCTTC 
GTGACCGAGT CC 

(2) INFORMATION ZU SEQ ID NO: 10: 

(i) SEQUEN2 CHARAKTERISTIKA: 

(A) LANGE: 235 Aminosauren 

(B) ART:' Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 10: 
Met Phe Thr Gly He Val Glu His He Gly Thr Val Ala Glu Tyr Leu 

15 10 15 

Glu Asn Asp Ala Ser Glu Ala Gly Gly Asn Gly Val Ser Val Leu He 

20 25 30 

Lys Asp Ala Ala Pro He Leu Ala Asp Cys His He Gly Asp Ser lie 

35 40 45 

Ala Cys Asn Gly He Cys Leu Thr Val Thr Glu Phe Thr Ala Asp Ser 

50 55 60 

Phe Lys Val Gly He Ala Pro Glu Thr Val Tyr Arg Thr Glu Val Ser 
65 70 75 80 

Ser Trp Lys Ala Gly Ser Lys lie Asn Leu Glu Arg Ala He Ser Asp 

85 90 95 

Asp Arg Arg Tyr Gly Gly His Tyr Val Gin Gly His Val Asp Ser Val 

100 105 110 

Ala Ser He Val Ser Arg Glu His Asp Gly Asn Ser He Asn Phe Lys 

115 120 125 

Phe Lys Leu Arg Asp Gin Glu Tyr Glu Lys Tyr Val Val Glu Lys Gly 

130 135 140 

Phe Val Ala He Asp Gly Val Ser Leu Thr Val Ser Lys Met Asp Pro 
145 150 155 160 
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Asp Gly Cys Phe Tyr lie Ser Met lie Ala His Thr Gin Thr Ala Val 

165 170 175 

Ala Leu Pro Leu Lys Pro Asp Gly Ala Leu Val Asn He Glu Thr Asp 
. . . 180 . 185. 190 • ■ : 

Val Asn Gly Lys Leu Val Glu Lys Gin Val Ala Gin Tyr Leu Asn Ala 

195 200 205 

Gin Leu Glu Gly Glu Ser Ser Pro Leu Gin Arg Val Leu Glu Arg lie 

210 215 220 

lie Glu Ser Lys Leu Ala Ser lie Ser Asn Lys 
225 230 . 235 

(2) INFORMATION ZU SEQ ID NO: 11: 
(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 1596 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Doppel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: cDNS zu mRNS 
(iii) HYPOTHETISCH: NEIN 
(iii) ANTI SENSE : NEIN 

<vi) URSPRUNLICHE HERKUNFT: 

(A) ORGANISMUS: Ashbya gossypii 

(ix) MERKMALE: 

(A) NAME/ SCHLUSSEL : 5 f UTR 

(B) LAGE: 1..352 
(ix) MERKMALE: 

(A) NAME/SCHLfJSSEL: CDS 

(B) LAGE: 353.. 1093 
(ix) MERKMALE: 

(A) NAME/SCHLOSSEL: 3 'UTR 

(B) LAGE: 1094.. 1596 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 11: 
AGAAGAAGCG CAGGCGCCAG TCCGAGCTGG AGGAGAACGA GGCGGCGCGG TTGACGAACA 
GCGCGCTGCC CATGGACGAT GCGGGTATAC AGACGGCGGG TATACAGACG GCGGGTGGTG 
CCGAGAGAGG CACCAGGCCG GCTTCCTCCA GCGATGCAAG GAAGAGAAGG GGACCAGAGG 
CGAAGTTCAA GCCATCTAAG GTACAGAAGC CCCAATTGAA GCGAACTGCA TCGTCCCGGG 
CGGATGAGAA CGAGTTCTCG ATATTATAGA GGCCCCCGTT TCGAGTGATT GGCGTCAAAA 
ACGGCTATCT GCCTTCGTCC GCCCCCACCA CCCTCGGGAA CACTGGCAAA CC ATG 

Met 
1 

GCG CTA ATA CCA.CTT TCT CAA GAT CTG GCT GAT ATA CTA GCA CCG TAC 
Ala Leu lie Pro Leu Ser Gin Asp Leu Ala Asp lie Leu Ala Pro Tyr 

5 10 15 

TTA CCG ACA CCA CCG GAC TCA TCC GCA CGC CTG CCG TTT GTC ACG CTG 
Leu Pro Thr Pro Pro Asp Ser Ser Ala Arg Leu Pro Phe Val Thr Leu 
20 25 30 



™ ftCMit ,n. PCT/EP95/00958 
WO 95/26406 

30 

ACG TAT GCG CAG TCC CTA GAT GCT CGT ATC GCG AAG CAA AAG GGT GAA 499 
Thr Tyr Ala Gin Ser Leu Asp Ala Arg He Ala Lys Gin Lys Gly Glu 
35 40 45 

. AGG * ACG GTT. ATT TCG CAT GAG GAG ACC AAG ACA ATG ACG' CAT' TAT CTA . • 547 
Arg Thr Val He Ser His Glu Glu Thr Lys Thr Met Thr His Tyr Leu 
50 55 60 65 

CGC TAC CAT CAT AGC GGC ATC CTG ATT GGC TCG GGC ACA GCC CTT GCG 595 
Arg Tyr His His Ser Gly He Leu He Gly Ser Gly Thr Ala Leu Ala 

70 75 80 

GAC GAC CCG GAT CTC AAT TGC CGG TGG ACA CCT GCA GCG GAC GGG GCG 643 
Asp Asp Pro Asp Leu Asn Cys Arg Trp Thr Pro Ala Ala Asp Gly Ala 

85 90 95 

GAT TGC ACC GAA CAG TCT TCA CCA CGA CCC ATT ATC TTG GAT GTT CGG 691 
Asp Cys Thr Glu Gin Ser Ser Pro Arg Pro He He Leu Asp Val Arg 

100 105 110 

GGC AGA TGG AGA TAC CGC GGG TCC AAA ATA GAG TAT CTG CAT AAC CTT 739 
Gly Arg Trp Arg Tyr Arg Gly Ser Lys He Glu Tyr Leu His Asn Leu 

115 120 125 

GGC AAG GGG AAG GCG CCC ATA GTG GTC ACG GGG GGT GAG CCG GAG GTC -787 
Gly Lys Gly Lys Ala Pro He Val Val Thr Gly Gly Glu Pro Glu Val 
130 135 140 145 

CGC GAA CTA GGC GTC AGT TAC CTG CAG CTG GGT GTC GAC GAG GGT GGC 835 
Arg Glu Leu Gly Val Ser Tyr Leu Gin Leu Gly Val Asp Glu Gly Gly 

150 155 160 

CGC TTG AAT TGG GGC GAG TTG TTT GAG CGA CTC TAT TCT GAG CAC CAC 883 
Arg Leu Asn Trp Gly Glu Leu Phe Glu Arg Leu Tyr Ser Glu His His 

165 170 175 

CTG GAA AGT GTC ATG GTC GAA GGC GGC GCG GAG GTG CTC AAC CAG CTG 931 
Leu Glu Ser Val Met Val Glu Gly Gly Ala Glu Val Leu Asn Gin Leu 

180 185 190 

CTG CTG CGC CCA GAT ATT GTG GAC AGT CTG GTG ATC ACG ATA GGA TCC 979 
Leu Leu Arg Pro Asp He Val Asp Ser Leu Val He Thr He Gly Ser 

195 200 205 

AAG TTC CTG GGC TCA CTA GGT GTT GCG GTC TCA CCA GCT GAG GAG GTG 1027 
Lys Phe Leu Gly Ser Leu Gly Val Ala Val Ser Pro Ala Glu Glu Val 
210 215 220 225 

AAC CTA GAG CAT GTG AAC TGG TGG CAC GGA ACA AGT GAC AGT GTT TTG 1075 
Asn Leu Glu His Val Asn Trp Trp His Gly Thr Ser Asp Ser Val Leu 

230 235 240 

TGC GGC CGG CTC GCA TAGCGGTTAT GACTGGTCTA CTAGTTAAAA CTATTTACTC 1130 
■ Cys Gly Arg Leu Ala 
245 

CTATACATAT TGCGTCACAT AGCGTTTATC CCCCTCGCCA ACCGCCTCGT GCCGTTGGAA 1190 
ACACGGCGGC CGGGGGACCT CAAGCGCTCC GCATCGACTA GTTTAATTTA CAAACAGATT 1250 
CTGTAACTTG CGTAACGGCC AGAGGTCTCT GACTTTCTGA TAATCTTCAC CACCTCACCT 1310 
CGCTTCAACC CCAGGTATAA TGCAACTTGG ATCCATCCTC TGGATTCTAG GTAACTGAGA 1370 
TTCCTTTAAC CTGTATCTCT TCAACAACTC CTTCTTTTCT TCGTCGCTGA GTTTGATATG 1430 
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TTTTGGCACA * AGCTCATGGT GCGTGATATT TACCACCAAA GCTGTTTCGT TGAAAGTCTC 1490 
AATTGTAGCA GGAGCGACGG AGGGAAGCAG TTTCAACGCG CTGGGCGTTA TGCCGTTCTG 1550 
ATATATGAAA ATACCCGTCT GGAAGTTCTT CTCGCCAATG TGGATC 1596 
. .{2) INFORMATION ZU SEQ ID NO: 12.': 

(i) SEQUENZ CH ARAKTERI ST IKA : 

(A) LANGE: 246 Amino saur en 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 12: 
Met Ala Leu lie Pro Leu Ser Gin Asp Leu Ala Asp lie Leu Ala Pro 

15 10 15 

Tyr Leu Pro Thr Pro Pro Asp Ser Ser Ala Arg Leu Pro Phe Val Thr 

20 25 30 

Leu Thr Tyr Ala Gin Ser Leu Asp Ala Arg lie Ala Lys Gin Lys Gly 

35 40 45 

Glu Arg Thr Val He Ser His Glu Glu Thr Lys Thr Met Thr His Tyr 

50 55 60 

Leu Arg Tyr His" His Ser Gly He Leu He Gly Ser Gly Thr Ala Leu 
65 70 75 80 

Ala Asp Asp Pro Asp Leu Asn Cys Arg Trp Thr Pro Ala Ala Asp Gly 

85 90 95 

Ala. Asp Cys Thr Glu Gin Ser Ser Pro Arg Pro lie lie Leu* Asp Val 

100 105 110 

Arg Gly Arg Trp Arg Tyr Arg Gly Ser Lys He Glu Tyr Leu His Asn 

115 120 125 

Leu Gly Lys Gly Lys Ala Pro He Val Val Thr Gly Gly Glu Pro Glu 

130 135 140 

Val Arg Glu Leu Gly Val Ser Tyr Leu Gin Leu Gly Val Asp Glu Gly 
145 150 155 160 

Gly Arg Leu Asn Trp Gly Glu Leu Phe Glu Arg Leu Tyr Ser Glu His 

165 170 175 

His Leu Glu Ser Val Met Val Glu Gly Gly Ala Glu Val Leu Asn Gin 

180 185 190 

Leu Leu Leu Arg Pro Asp He Val Asp Ser Leu Val He Thr He Gly 

195 200 205 

Ser Lys Phe Leu Gly Ser Leu Gly Val Ala Val Ser Pro Ala Glu Glu 

210 215 220 

Val Asn Leu Glu His Val Asn Trp Trp His Gly Thr Ser Asp Ser Val 
225 230 235 240 

Leu Cys Gly Arg Leu Ala 
245 
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Patent anspriiche 

1.. DNA-Sequenzen, die fur ein Polypeptid mit der in SEQ ID NO: 2 
5 dargesteilten Aminosauresequenz codiefen oder fiir ein Analo- 
ges oder Derivat des Polypeptids gemaJl SEQ ID NO: 2, worin 
eine oder mehrere Aminosauren deletiert, hinzugefiigt oder 
durch andere Aminosauren substituiert worden sind, ohne die 
enzymatische Wirkung des Polypeptids wesentlich zu reduzie- 
10 ren. 

2. DNA-Sequenzen, die fiir ein Polypeptid mit der in SEQ ID NO: 4 
dargesteilten Aminosauresequenz codieren Oder fiir ein Analo- 
ges oder Derivat des Polypeptids gema& SEQ ID NO: 4, worin 
15 eine oder mehrere Aminosauren deletiert, hinzugefiigt oder 

durch andere Aminosauren substituiert worden sind, ohne die 
enzymatische Wirkung des Polypeptids wesentlich zu reduzie- 
ren. 

20 3. DNA-Sequenzen, die fiir ein Polypeptid mit der in SEQ ID NO: 6 
dargesteilten Aminosauresequenz codieren oder fiir ein Analo- 
ges oder Derivat des Polypeptids gemafi SEQ ID NO: 6, worin 
eine oder mehrere Aminosauren deletiert, hinzugefiigt oder 
durch andere Aminosauren substituiert worden sind, ohne die 

25 enzymatische Wirkung des Polypeptids wesentlich zu reduzie- 
ren. 

4. DNA-Sequenzen, die fiir ein Polypeptid mit der in SEQ ID NO: 8 
dargesteilten Aminosauresequenz codieren oder fiir ein Analo- 

30 ges oder Derivat des Polypeptids gemaB SEQ ID NO: 8, worin 
eine oder mehrere Aminosauren deletiert, hinzugefiigt oder 
durch andere Aminosauren substituiert worden sind, ohne die 
enzymatische Wirkung des Polypeptids wesentlich zu reduzie* 
ren. 

35 

5. DNA-Sequenzen, die fiir ein Polypeptid mit der in SEQ ID NO: 
10 dargesteilten Aminosauresequenz codieren Oder fiir ein Ana- 
loges oder Derivat des Polypeptids gemaii SEQ ID NO: 10, worin 
eine oder mehrere Aminosauren deletiert, hinzugefiigt oder 

40 durch andere Aminosauren substituiert worden sind, ohne die 
enzymatische Wirkung des Polypeptids wesentlich zu reduzie- 
ren. 
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6. DNA-Sequenzen, die fur ein Polypeptid mit der in SEQ ID NO: 
12 dargestellten Aminosauresequenz codieren oder fur ein Ana- 
loges oder Derivat des Poiypeptids gemafi SEQ ID NO: 12 , worin 
eine oder. mehrere Aminosauren deletiert, hinzugef ygt oder . - 

5 durch andere Aminosauren substituiert worden sind, ohne die 

enzymatische Wirkung des Poiypeptids wesentlich zu reduzie- 
ren. 

7. Expressionsvektor , enthaltend eine oder mehrere DNA-Sequenzen 
10 gemafi Anspruch 1 bis 6. 

8. Wirtsorganismus der mit einem Expressionssystem gemafi An- 
spruch 7 transf ormiert worden ist. 

15 9. Rekombinantes Herstellverf ahren fur Riboflavin, dadurch ge- 
kennzeichnetr dafl ein Wirtsorganismus gemafl Anspruch B 
verwendet wird. 
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